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fi 要 : [目的 /意义 ] 分 析 广 西 甘 苹 主 产 区 甘 莽 产量 与 气象 因素 的 关系 ， 利 用 气象 数据 预测 甘 蕊 产量 ， 为 糖 厂 及 
相关 管理 部 门 提供 科学 的 数据 支撑 。[ 方 法 ] 选用 2002~2019 年 广西 五 个 不 同 地 级 市 内 莽 区 的 产量 数据 及 14 种 逐 
日 气象 数据 ， 将 每 年 的 各 气象 因子 以 78 个 逐 月 递增 的 连续 时 段 的 均值 与 产量 进行 相关 性 分 析 ， 根 据 人 敏感 时 段 分 析 
法 确定 关键 气象 因子 ， 并 分 析 各 气象 因子 在 敏感 时 段 对 产量 的 影响 。 分 别 利用 BP 神 经 网 络 (BP Neural Network , 
BPNN)、 支 持 向 量 机 (Support Vector Machine, SVM). 、 随 机 森林 (Random Forest，RF) 、 长 短期 记忆 网 络 (Long 
Short-Term Memory, LSTM) 建立 单 蔗 区 产量 预测 模型 ， 并 采用 以 全 生育 期 气象 均值 作为 模型 输入 的 方法 进行 对 照 
实验 。 使 用 HP 滤波 法 (Hodrick Prescott Filter) 分 离 出 甘蔗 气象 产量 ， 将 5 个 蔗 区 的 数据 混合 ， 分 别 利用 RF、 
SVM, BPNN 和 LSTM 建立 通用 的 多 蘑 区 气象 产量 预测 模型 。[ 结 果 和 讨论 ] 对 于 单 蘑 区 ， 敏 感 时 段 分 析 法 的 模型 


预测 效果 明显 优 于 全 生育 期 取 气 象 均值 的 方法 ，LSTM 模型 对 于 上 述 两 种 数据 处 理 方法 的 预测 效果 均 明显 优 于 目 


前 广泛 使 用 的 BPNN 、SVM、RF 模 型 ， 敏 感 时 段 分 析 法 的 LSTM 模型 整体 的 均 方 根 误差 (Root Mean Square Error, 
RMSE) 和 平均 绝对 百分比 误差 (Mean Absolute Percentage Error, MAPE) 分 别 为 10.34 t/ha #16.85%, PRE RAL R? 
240.8489. XI FARE, LSTM 预测 结果 较 差 ，RFE、SVM 及 BPNN 三 种 预测 模型 都 取得 了 良好 的 效果 ， 预 测 效果 最 


好 的 BPNN 模型 的 RMSE FI MAPE 分 别 为 0.98 t/ha #119.59%, R29 0.965. [W] 通过 敏感 时 段 分 析 法 筛选 的 关键 
气象 因子 与 产量 均 呈 显著 相关 ， 根据 敏感 时 段 能 准确 地 分 析 各 气象 因子 对 产量 的 影响 。 使 用 LSTM 模型 预测 单 芒 
区 产量 ， 使 用 BPNN 模型 预测 多 蔗 区 甘蔗 气象 产量 的 方法 是 可 行 的 ， 且 预测 误差 在 可 接受 范围 内 。 
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15| 言 


区 域 作物 产量 预测 对 国家 粮食 安全 评估 尤为 重 
要 "食糖 是 国家 战略 物资 ， 其 中 87% 的 产量 来 自 
甘 感 ， 而 广西 的 甘 万 产量 位 居 全 国 首 位 ， 近 年 来 约 
占 全 国 总 产量 的 70% ”。 对 广西 甘蔗 进行 大 尺度 的 
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佑 产能 为 糖 三 及 相关 管理 部 门 提供 科学 的 数据 文 
撑 。 除 土地 生产 力 之 外 ,大 田 作物 产量 的 高 低 主要 
受 施 肥 、 灌 溉 、 植 保 等 人 为 管理 因素 〈 生 产 水 平 ) 
及 降雨 、 光 照 、 风 速 等 气候 因素 的 制约 。 地 理 和 人 
为 管理 方式 通常 比较 稳定 ， 气 候 是 影响 产量 的 最 不 
可 控 因 素 。 近 年 来 ， 越 来 越 多 的 研究 人 员 投入 到 基 
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于 气象 数据 的 农作物 产量 预测 研究 中 。 高 俊杰 等 ” 
通过 广东 省 後 庆 市 高 要 区 多 年 的 气象 数据 建立 早 称 
的 产量 预测 模型 ， 模 型 平均 准确 率 为 80.23%。 于 珍 
珍 等 ”使 用 遗传 算法 优化 神经 网 络 来 预测 甘蔗 产 
5. RAAT 0.842, Bk E. 利用 陕西 杨凌 、 合 阳 、 
长 武 等 地 区 及 各 站 点 的 多 年 历史 气象 数据 建立 玉米 
产量 预测 模型 ， 整 体 预测 结果 趋 近 于 实际 产量 OE 
均 绝 对 相对 误差 < 15%)。 基 于 气象 对 产量 进行 预 
测 的 研究 中 ， 通 常 需要 将 产量 分 割 为 趋势 产量 与 气 
象 产量 。 趋 势 产 量 通常 由 地 力 、 管 理 等 因素 决定 ， 
气象 产量 由 气象 决定 。 目 前 产量 分 离 方法 的 研究 主 
要 以 滑动 平均 法 和 Logistic 拟 合法 为 主 。 王 二 虎 和 
宋 晓 “ 利用 滑动 平均 的 方法 将 花生 气象 产量 和 趋 
势 产 量 进行 分 离 处 理 ， 平 均 预 测 精 度 达 到 了 9196. 
何 虹 等 ”利用 五 点 二 次 平滑 法 对 宁夏 引 黄 灌区 玉 
米 的 趋势 产量 与 气候 产量 进行 分 离 ， 其 相对 气候 产 
量 模型 复 相 关系 数 均 达 0.73 以 上 。 另 外 ,气象 数据 
因素 多 、 数 据 量 大 ， 通常 需要 预 处 理 来 更 有 效 地 提 
取 气 象 特征 。 顾 雅文 等 将 阿克苏 地 区 苹果 进行 
月 平均 气象 数据 与 气象 产量 进行 相关 性 分 析 ， 确 定 
敏感 月 份 的 气象 特征 来 进行 后 续 建 模 。 何 修 君 ” 
将 气象 日 、 月 、 年 数据 分 别 与 玉米 产量 进行 相关 性 
分 析 来 选取 气象 特征 ， 分 别 用 三 个 时 间 维 度数 据 训 
练 玉米 产量 预测 模型 ， 实 现 日 、 月 、 年 三 种 时 间 维 
度 的 产量 预测 。 李 严明 UU 将 小 麦 全 生育 期 的 气象 
数据 取 平均 值 后 与 气象 产量 进行 相关 性 分 析 ， 提 取 
得 到 敏感 的 气象 特征 进行 建 模 。 针 对 不 同 地 区 的 作 
物产 量 预测 ， 前 人 也 对 多 种 建 模 方法 进行 了 尝试 。 
Zhao 等 ”使 用 作物 机 理 和 统计 回归 模型 结合 的 方 
法 来 预测 小 麦 产量 ， 相 关系 数 达 到 了 0.86. Croci 
等 ”利用 动静 因子 及 物候 的 方法 发 布 最 佳 预测 时 
间 ， 使 用 高 斯 过 程 回归 对 玉米 产量 进行 预测 ， 最 佳 
性 能 归 一 化 均 方 根 误 差 (Normalized Root Mean 
Square Error, nRMSE) 为 13.3196, Oikonomidis 
Ak CU 使 用 混合 卷 积 神经 网 络 -深度 神经 网 络 (Con- 
volutional Neural Networks-Deep Neural Networks, 
CNN-DNN) 模型 在 土豆 公共 数据 集 上 进行 预测 ， 
模型 的 预测 拟 合 度 为 0.87。Di 等 ' 利用 贝 叶 斯 优 
化 的 长 短 时 记忆 模型 预测 冬小麦 产量 ,优化 后 RR 的 
最 好 效果 为 0.80。Burdett 和 Wellen "使 用 多 种 机 


器 学 习 方 法 分 别 对 玉米 和 大 豆 产 量 进行 预测 ， 效 果 
最 好 的 为 随机 和 森林 (Random Forest, RF) 模型 ， 
尼 分 别 为 0.85 和 0.94。 

尽管 前 人 在 气象 产量 预测 方面 进行 了 大 量 的 研 
究 ， 但 缺乏 对 于 逐 月 分 析 气 象 对 甘 妨 产量 的 影响 以 
及 适应 于 多 莽 区 的 产量 预测 模型 的 研究 。 本 研究 运 
FAS Vl 5 AEREE DX IRE DX 2002—2019 4E. AY) H 18 
SMR BL A AL TE Pt OBL, DUREE ZR YREZEH 
份 气象 均值 的 数据 与 产量 数据 进行 相关 性 分 析 ， 确 
定 最 优 的 敏感 时 段 ， 分 析 关 键 气象 因子 在 敏感 时 段 
对 甘蔗 产量 的 影响 。 将 处 理 后 的 数据 ， 利 用 长 短期 
记忆 网 络 (Long Short-Term Memory, LSTM) 与 
BP 神经 网 络 (BP Neural Network, BPNN), x4 
向 量 机 (Support Vector Machine, SVM), RF 建立 
产量 预测 对 比 模型 ， 实 现 单 蔗 区 的 产量 预测 。 使 用 
HP 滤波 法 (Hodrick Prescott Filter) 分 离 甘 蔗 产 量 ， 
消除 不 同 莽 区 之 间 的 差异 ， 将 广西 5 个 蔗 区 数据 混 
合 ， 利 用 BPNN、SVM、RF 建立 通用 的 多 莽 区 气 
象 产量 预测 模型 ， 实 现 多 大 区 的 产量 预测 ， 旨 在 为 
广西 甘蔗 种 植 管理 与 相关 政策 制定 提供 科学 的 数据 
参考 。 


2 材料 与 方法 


2.1 数据 来 源 


研究 区 域 为 位 于 广西 壮族 自治 区 5 个 不 同 地 级 
市 的 芒 区 ， 面 积 在 870~18,500 ha 之 间 。 广 西 芒 区 
大 部 分 属于 亚热带 季风 气候 ， 年 平均 气温 16.5 一 
23.1C， 大 于 10*C 的 积温 5000~8300*C， 年 降水 量 
1300—2000 mm， 日 照 时 数 1500~1800 h， 充 足 的 
降雨 、 日 照 ， 以 及 适宜 的 气温 为 甘蔗 生长 提供 了 和 良 
好 的 气象 条 件 。 各 芒 区 历年 的 产量 数据 巾 广西 糖 业 
集团 有 限 公 司 ( 原 广西 农垦 糖 业 集团 ) 提供 ， 包 括 
2002—2019 E 18 4 FE ZEB A E DC S ndm CE 
BES BE DEAN EL ZS FF RERBA REO S FTE IX 18 
年 的 产量 数据 统计 表 如 表 1 所 示 。 

气象 数据 来 自 于 国家 气象 科学 数据 中 心 (中 国 
气象 数据 网 ，http:/data.cma.cn) 。 选 取 了 距离 各 芒 
区 直线 距离 最 近 的 5 个 气象 站 点 的 2002 一 2019 年 的 
日 值 数据 集 ， 包 含 : 20 一 8 时 和 8 一 20 时 降水 量 
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R1 各 芒 区 2002 一 2019 年 产量 统计 表 
Table 1 The statistical information of sugarcane yields of differ- 


ent planting regions from 2002 to 2019 


产量 /(tha) ”矿区 1 EX2 FERS —JEIXA4 HE 5 


最 大 值 161.60 91.02 96.72 96.65 126.89 
最 小 值 54.59 58.28 51.75 62.17 37.60 
平均 值 91.03 72.24 71.01 78.47 66.27 


4 的 取 值 没有 特定 的 标准 ， 针 对 不 同 的 时 间 尺 
度 〈 如 年 度 、 季 度 、 月 度 等 )， 其 取 值 也 有 所 不 同 。 
本 研究 根据 甘 芒 年 产量 数据 特点 ， 确 定 4 为 100…”。 
2.2.2 气象 数据 处 理 

为 了 论证 本 研究 气象 数据 处 理 方法 的 科学 性 ， 
针对 单 芒 区 ， 使 用 处 理 后 的 气象 数据 与 甘蔗 实际 产 


(20 时 至 第 二 天 20 时 降水 量 )、 极 大 风速 、 平 均 气 
压 、 平 均 2 min 风速 、 平 均 气 温 、 平 均 水 汽 压 、 平 
均 相 对 湿度 、 日 照 时 数 、 最 低 和 气压、 最低 气温 、 最 
高 气压 、 最 高 气温 、 最 大 风速 、 最 小 相对 湿度 等 14 
个 气象 因素 。 各 芒 区 中 心 点 与 对 应 站 点 的 直线 距离 
均 在 40 km 范围 内 。 为 提高 降水 量 的 空间 分 辩 率 ， 
本 研究 还 参考 了 Qu 等 "9 RRE Science Data Bank 
的 1960~-2020 年 中 国 1 km 分 辩 率 月 降水 数据 集 。 


2.2 数据 预 处 理 


2.2.1 产量 数据 预 处 理 

为 了 消除 区 域 性 差异 ， 本 研究 针对 多 莽 区 混合 
建 模 时 ， 尝 试 从 甘 芒 视 在 产量 分 离 出 由 气象 因素 影 
响 的 那 部 分 产量 波动 ， 即 气象 产量 。 

作物 的 产量 受 自然 和 社会 等 因素 的 综合 影响 。 
为 更 好 地 探究 各 因素 对 产量 的 作用 ， 通 常 将 视 在 产 
量 分 解 为 趋势 产量 、 气 象 产量 和 随机 波动 产量 3 个 
分 量 ， 如 公式 (1) Bras, 

Y=Y,+Y,+e (1) 

其 中 ,， 了 为 视 在 产量 ，t/ha; 了 为 趋势 产量 ,，t/ 
ha， 由 生产 水 平 、 土 地 生产 力 等 因素 所 决定 ， 具 有 
长 期 趋势 性 ;了 ,为 气象 产量 ，t/ha， 由 气象 因素 所 
决定 ; e 为 随机 噪声 。 

本 研究 采用 HP 滤波 法 "分 离 产量 。 假设 dni 
G=1，2，…，717; n 为 样本 容量 ) 是 一 个 长 时 间 序 
A, 包含 长 期 趋势 成 分 g，( 本 研究 指 甘 莽 的 趋势 产 
Ht) 以 及 短期 波动 成 分 c (本 研究 指 甘 蔗 的 气象 产 
量 )， 如 公式 (2) 所 示 。 

h,— g, ^ c, (2) 

HP 滤波 法 的 主要 思想 是 使 长 时 间 序 列 上 的 长 
期 趋势 成 分 g, 和 视 在 产量 序列 有 之 间 偏 差 的 平方 和 
Hh, WAR (3) 所 示 。 

Bc (hi By t4» leas) "(s 

g£-i)fT (3) 


量 数据 建立 产量 预测 模型 ， 并 与 前 人 气象 数据 处 理 
方法 的 预测 结果 进行 对 照 。 

甘蔗 作物 生长 期 长 达 12~14 个 月 ， 其 产量 易 受 
持续 性 的 降雨 、 大 风 、 低 温 等 气象 因素 影响 ， 且 影 
响 程 度 因 不 同 生长 期 而 异 。 前 人 研究 大 多 以 整个 生 
育 期 内 或 特定 时 段 的 气象 均值 作为 基本 因子 进行 分 
析 ， 忽 略 了 不 同 生长 期 对 应 的 时 段 长 短 及 主要 影响 
因子 具有 差异 的 客观 规律 ， 如 1~2 个 月 的 苗 期 需要 
适宜 的 水 分 ，2~3 个 月 的 伸 长 期 需要 大 量 的 水 分 ， 
3~4 个 月 的 成 熟 期 需要 控制 水 分 的 过 量 摄 入 以 免 影 
响 糖 分 的 积累 ， 生 长 期 后 期 及 成 熟 期 间 持续 性 大 风 
和 低温 对 产量 会 造成 不 良 影响 。 

为 了 寻找 最 优 的 时 段 ， 本 研究 采用 敏感 时 段 分 
析 法 ， 将 甘 芒 每 年 (1 一 12 月) 的 气象 数据 以 不 同 
起 始 月 份 的 按 月 递增 的 时 间 宽 度 构建 了 78 个 连续 
时 段 (如 1 月 开始 连续 1 个 月 、2 个 月 …… ，2 月 开 
始 连 续 1 个 月 、2 个 月 …… ，3 月 开始 连续 1 个 月 、 
A34 He ， 以 此 类 推 ); 然后 分 别 计算 不 同时 段 
下 的 气象 均值 5S,, (i, j=l, 2, ^s, 12; t- 1, 
2, ++, 18; isj)。 然 后 针对 不 同 蔗 区 ， 分 析 18 年 
来 不 同时 段 的 14 种 气象 均值 与 甘蔗 产量 的 相关 性 
(公式 4)。 


SG, - 552 (Q; - Y) 
r; =|= Tr =| (4) 
[Ses -8,) [Se =i) 

其 中 ，t 表 示 年 份 ; i, 7 表示 月 份 ; 5, ,为 某 气 
象 因子 第 1 年 第 i 月 到 第 j 月 的 均值 ; ,为 第 并 月 下 
某 气象 因子 均值 与 产量 的 相关 系数 ， 共 78 个 。 相 
关系 数 高 说 明 该 因素 对 甘蔗 产量 的 影响 大 ， 可 选 为 
模型 变量 。 
2.2.3 数据 标准 化 

气象 数据 指标 多 、 量 纲 不 一 致 ， 会 对 建 模 造 成 
一 定 的 影响 。 另 外 ， 本 研究 除了 对 单一 蔗 区 进行 产 
量 预 测 ， 还 将 基于 多 个 蔗 区 的 混合 数据 构建 通用 的 
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气象 产量 预测 模型 ， 而 不 同 芒 区 的 产量 差异 明显 ， 
对 建 模 也 会 造成 影响 。 为 了 消除 气象 数据 量 纲 差异 
及 不 同 芒 区 产量 差异 的 影响 ， 本 研究 将 气象 数据 和 
产量 数据 均 进 行 了 归 一 化 处 理 。 

常用 的 归 一 化 方法 主要 有 线性 函数 归 一 化 和 零 
值 归 一 化 。 考 虑 到 甘蔗 气象 产量 存在 负 值 ， 使 用 线 
性 函数 归 一 化 将 气象 数据 与 甘蔗 产量 数据 缩放 到 
[-1, 1], WAR (5) 所 示 。 

2X(X-X, 


其 中 ,成 表示 归 一 化 后 的 结果 ; 表示 原始 数 
据 ; Xa. Xm 分 别 代表 原始 数据 中 的 最 大 、 最 
小 值 。 


2.3 模型 构建 


本 研究 采用 了 在 产量 预测 中 广泛 使 用 的 RF、 
SVM 及 BPNN 这 3 种 较 传统 的 算法 以 及 LSTM 这 一 
深度 学 习 算法 分 别 建立 了 单 芒 区 的 视 在 产量 预测 模 
型 和 多 蔗 区 的 气象 产量 预测 模型 。 

2.3.14 BPNN 

BPNN — A Hi f A JE. Bek c ERU i h EA 
x °°), TROMDERO DS BE E ERT ES B 2504 , 
其 层 数 经 多 次 尝试 后 确定 为 1 层 。 模 型 的 输入 层 为 
经 挑选 得 到 的 敏感 时 段 的 敏感 气象 因子 作为 模型 的 
输入 ;隐藏 层 神经 元 个 数 通 过 试 凑 法 确定 ; 输出 层 
节点 数 为 1， 即 产量 。 为 了 避免 模型 过 拟 合 ， 将 模 
型 训练 迭代 次 数 “epoch” 设 置 为 200,， “dropout” 
设置 为 0.3， 训 练 批 次 大 小 设置 为 4。 以 茂 区 1 为 
例 ， 其 模型 训练 过 程 的 损失 如 图 1 所 示 。 可 以 看 
出 ， 随 着 迭代 次 数 的 增加 ， 训 练 集 和 验证 集 损失 不 
断 变 小 ， 模 型 整体 不 断 收敛 。 

2.3.2 SVM 

SVM "产量 预测 模型 的 构建 需要 重点 关注 核 
函数 的 选取 。 本 研究 对 训练 数据 分 别 采用 线性 核 函 
数 、 多 项 式 核 函 数 与 径 向 基 核 函数 进行 建 模 效果 对 
比 ， 最 终 选 取 径 向 基 核 函数 ， 该 核 函 数 能 很 好 地 对 
不 同 维度 的 数据 进行 非 线 性 映射 。 其 他 参数 选择 了 
默认 值 。 

2.8.8 RF 

RF 预测 模型 的 构建 需要 通过 网 格 交叉 搜索 的 

方式 遍历 参数 词典 ， 以 寻找 最 优 参数 站。 参数 


1 (5) 


0 25 50 75 100 125 150 175 200 
Epoch 


图 1 BPNN SE D 4 33 42.89 HA RICA FER 1 29 0) 
Fig.1 The loss changes of the BPNN model (Planting Region 1) 
"n estimators" 是 每 次 选取 的 决策 树 个 数 ， 
"max depth” + RF AY d X $E, "max features" 
是 划分 决策 树 时 考虑 的 最 大 特征 数 ， 各 和 请 区 对 应 的 
最 优 训练 参数 如 表 2 所 示 。 


表 2 各 亡 区 RF 产量 预测 模型 的 最 优 训练 参数 
Table 2 The optimal training parameters of the BPNN model 


for each planting region. 


最 优 参数 EKI JGEXx2 K3 K4 ORES 


n_estimators 5 10 5 5 10 

max depth 3 5 5 11 T 

max_features 14 14 4 7 4 
2.3.4 LSTM 


LSTM | 预测 模型 含有 1 个 输入 层 、1 个 隐 售 
层 及 1 个 输出 层 ， 其 中 隐 含 层 拥 有 25 个 神经 元 。 模 
型 的 时 间 步 长 (Time Step) 设置 为 3， 训 练 迭 代 次 
数 为 40， 批 处 理 大 小 为 2。 


3 结果 与 讨论 


3.1 不 同 蔗 区 的 关键 气象 因子 分 析 


3.1.1 气象 因子 间 相 关 性 分 析 

将 每 年 每 个 芒 区 的 14 个 气象 因子 在 78 个 不 同 
时 段 下 的 均值 ( 共 14X78 个 数据 ) 与 产量 进行 相 
关 性 分 析 。 以 莽 区 1 为 例 ， 部 分 具有 代表 性 的 气象 
因子 之 间 以 及 他 们 与 产量 之 间 的 相关 系数 热力 图 如 
图 2 所 示 (未 显示 时 段 信息 )。 如 果 气 象 因子 之 间 
的 相关 性 太 高 说 明 自 变量 间 存 在 较 高 的 自 相关 ， 对 
建 模 不 利 ; 因此 需要 对 相关 性 较 高 的 多 个 气象 因子 
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进行 筛选 ， 仅 保留 1 个 因子 作为 代表 。 经 相关 性 分 
析 对 因子 进行 第 选 ， 基 本 确定 了 若干 个 代表 性 因 


20 - 208 降 水 量 
BARE 
平均 气压 EET 

SPEZIMA TUE 
平均 气温 
Hpk 
Pameti 
日 限时 数 
PARSE - 0102 

= 
最 高 气压 = 
assa- 1,100 


RAR 


annie EO L 
4 和 产量 = 0354 | BAL T 
L 
E d eo & 
es F. est x FS 
Ga * T «P a 
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T, 包括 日 照 时 数 、 平 均 2 分 钟 风 速 、 最 大 风速 、 
最 小 相对 湿度 、 平 均 水 气压 等 。 


图 2 2002 一 2019 年 蓄 区 1 气象 因子 及 产量 的 相关 性 热力 图 


Fig. 2 The correlation heat map of different meteorological factors and yields in Planting Region 1 in 2002 to 2019 


3.1.2 关键 气象 因子 及 敏感 时 段 分 析 

根据 前 文 的 气象 数据 处 理 ， 最 终 确定 与 产量 关 
系 密切 且 自 相关 性 低 的 关键 时 段 的 敏感 气象 因子 如 
表 3 所 示 。 可 以 看 出 ,不 同 蘑 区 的 敏感 气象 因子 以 
及 关键 时 段 均 有 较 大 差异 。 不 同时 段 的 气象 因子 在 
不 同 莽 区 的 相关 性 甚至 相反 ， 这 主要 是 由 于 甘蔗 部 
分 丰 欠 气象 指标 跟 甘 蔗 生 理气 象 指标 并 不 完全 吻合 
导致 的 六。 

根据 相关 性 结果 分 析 ， 在 分 葛 期 ， 日 照 时 数 与 
产量 呈 显 著 正 相关 ， 良 好 的 光照 可 以 促进 分 蒙 ， 有 
利于 甘蔗 增产 。 在 伸 长 期 后 期 至 成 熟 期 ， 日 照 时 数 
与 产量 呈 显 著 负 相关 ， 该 时 期 降水 量 较 少 ， 过 于 充 
足 的 光照 容易 导致 甘蔗 枯死 ， 阻 碍 甘蔗 增产 。 在 幼 
苗 期 至 分 更 期 ， 甘 蔗 产 量 与 最 大 风速 旦 显著 负 相 
关 ， 甘 蔗 幼 苗 受 最 大 风速 影响 容易 发 生 折 断 ， 折 晰 
后 严重 影响 后 期 生长 而 导致 产量 降低 。 

在 萌芽 期 和 伸 长 期 ， 平 均 水 汽 压 与 甘蔗 产量 呈 
显著 正 相 关 。 平均 水 汽 压 与 降水 量 及 各 种 温度 、 湿 
度 均 呈 显 著 正 相关 ， 主 要 通过 影响 其 他 气象 因素 而 
影响 甘蔗 产量 ， 是 一 个 综合 性 气象 指标 ， 因 此 利用 
平均 水 汽 压 评估 气象 条 件 的 好 坏 及 粗略 预 估 甘 芒 产 
量 的 发 展 趋势 具有 一 定 意义 。 


在 萌芽 期 ， 最 低 气 温 与 产量 呈 显 著 正 相关 ， 适 
宜 的 最 低 气温 有 利于 种 茎 内 酶 活性 的 提高 ， 加 快 萌 
芽 。 在 幼苗 期 ,平均 气温 与 产量 呈 显 着 正 相 关 ， 气 
温 适 当 升 高 有 利于 幼苗 生长 。 在 伸 长 期 和 成 熟 期 ， 
最 高 气温 、 平 均 气温 均 与 产量 旺 显著 负 相关 ， 该 时 
期 光照 充足 ， 持 续 高 温 加 剧 了 甘蔗 枯死 ， 使 甘 妃 减 
产 。 在 伸 长 期 最 低 气 温 与 产量 呈 显 著 负 相关 ， 该 
时 期 气温 日 较 差 小 ， 不 利于 甘蔗 光合 作用 及 糖分 的 
积累 ， 导 致 减产 ， 因 此 在 该 伸 长 期 降低 夜间 环境 温 
度 有 利于 增产 。 

多 种 气象 因素 与 各 种 气压 之 间 呈 显著 正 相 关 
但 与 产量 呈 显 著 负 相关 ， 主 要 影响 时 段 为 幼苗 期 ， 
而 气压 对 幼苗 生长 的 作用 是 间接 的 ， 主 要 通过 影响 
其 他 气象 因子 起 作用 ， 高 压 下 不 利于 幼苗 生长 。 

在 伸 长 期 ， 降 水 量 与 产量 呈 极 显著 负 相 关 ， 甘 
工 主 要 通过 根部 吸收 水 分 ， 该 时 段 降水 量 过 多 会 导 
BUKERE, HERK HRAS TBUIRT, 
因此 降雨 量 较 多 应 及 时 将 水 排出 ， 防 止 甘蔗 减产 。 
在 伸 长 期 至 成 熟 期 ， 降 水 量 与 产量 呈 显 著 正 相关 ， 
甘 了 在 这 两 个 时 期 对 水 的 需求 量 很 大 ， 进 一 步 说 明 
该 时 期 降水 量 不 满足 甘蔗 生长 的 水 分 需求 ， 增 加 该 
时 段 的 降水 量 有 利于 甘蔗 增产 。 在 成 熟 期 后 期 ， 最 
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RI ERDX 5645 8 B^) Gic i ^ S ELT 0 2S SEE ERE B 
Table 3 The sensitive meteorological factors and key time 


spans found for the five planting regions 


TEK 气象 因子 与 产量 的 相关 系数 ”影响 时 段 
日 照 时 数 -0.766 10 一 11 月 
平均 2 分 钟 风速 -0.617 10 一 11 月 
JEK 1 最 大 风速 -0.583 4 一 5 月 
最 小 相对 湿度 0.473 11 月 
平均 水 气压 0.454 6 月 
平均 水 气压 0.663 2 一 3 月 
最 低 气 温 0.648 2 一 3 月 
WER 2 最 低 气 压 -0.606 3 月 
平均 气温 0.596 2 一 4 月 
20 时 至 第 二 天 20 时 降 
0.527 8 月 
水 量 
20 时 至 第 二 天 20 时 降 
M 0.776 8 一 9 月 
水 量 
日 照 时 数 -0.555 8 一 9 月 
BRE 3 最 低 气 温 0.542 3 月 
平均 水 气压 0.487 3 月 
最 高 气温 -0.465 8—11 H 
最 高 气温 -0.672 8 一 12 月 
平均 气温 -0.570 7 一 12 月 
， 20 时 至 第 二 天 20 时 降 
芒 区 4 M 0.657 3—12 A 
水 量 
日 照 时 数 0.502 5 月 
最 低 气 温 -0.448 8A 
平均 水 气压 0.829 6 一 8 月 
平均 相对 湿度 0.715 2 一 10 月 
EKS 最 低 气压 -0.697 2 一 3 月 
最 高 气压 -0.696 2 一 3 月 
20 时 至 第 二 天 20 时 降 
- -0.437 6—7H 
水 量 


小 相对 湿度 与 甘蔗 产量 呈 显 著 正 相关 ， 该 时 期 干旱 
也 会 导致 甘 莽 减产 。 平 均 相 对 湿度 对 产量 的 影响 几 
乎 贯穿 甘蔗 的 整个 生育 期 ， 与 产量 呈 显 著 正 相关 ， 
平均 相对 湿度 主要 受降 雨量 影响 ， 增 大 降雨 量 ， 有 
利于 甘 蕊 增产。 由 此 可 知 ， 甘 其 在 全 生育 期 对 水 的 
需求 量 很 大 ， 但 在 某 一 时 期 降水 量 过 多 或 过 少 都 不 
利于 甘蔗 增产 ， 因 此 适宜 的 降水 对 甘蔗 生长 尤为 
EH, 


3.2 单 蔗 区 实际 产量 建 模 


将 上 述 筛选 得 到 的 各 蔗 区 关键 时 段 的 敏感 气象 
因子 和 产量 数据 标准 化 ， 然 后 将 2002 一 2019 年 共 
18 年 的 甘蔗 产量 数据 按 7 : 3 的 比例 随机 划分 为 训 
练 集 与 测试 集 ， 再 分 别 采 用 BPNN 、SVM、RF 以 
及 LSTM 方 法 构建 各 芒 区 的 视 在 产量 预测 模型 ， 并 
进行 对 比 。 为 反映 本 研究 提出 的 敏感 气象 因子 分 析 
方法 的 有 效 性 ， 特 采用 同样 的 模型 算法 基于 李 严 
明 "所 用 的 年 均 气 象 因子 构建 产量 模型 并 对 比 
二 者 结果 。 

3.2.1 BPNN 预测 模型 

各 蔗 区 的 BPNN 视 在 产量 模型 的 预测 结果 如 
表 4 所 示 。 基 于 本 文 分 析 所 得 关键 时 段 敏感 气象 因 
子 建立 的 BPNN 模型 整体 上 均 明 显 优 于 对 照 方 法 。 
在 5 个 蔗 区 中 ， 芒 区 4 的 预测 结果 最 好 ， 产 量 预测 
值 与 实际 值 之 间 的 均 方 根 误差 (Root Mean Square 
Error, RMSE) 仅 为 5.04 t/ha, 平均 绝对 百分比 误 
差 (Mean Absolute Percentage Error, MAPE) [Xy 
5.62%; 预测 结果 最 差 的 为 芒 区 1，RMSE 高 达 为 
24.34 t/ha. 


表 4 各 和 芒 区 BPNN 模型 的 视 在 产量 预测 结果 
Table 4 The apparent yield prediction results of the BPNN 


models for each planting region 


本 研究 方法 对 照 方法 
EK 
RMSE/(tha!) MAPE/% RMSE/(tha') MAPE/% 

JEK 1 24.34 11.88 37.125 32.29 
FE 2 9.25 9.37 14.145 18.19 
HEX 3 8.51 10.05 23.64 36.80 
HED 4 5.04 5.62 9.02 9.71 
HEX 5 11.37 18.08 17.67 29.75 


3.2.2 SVM 预测 模型 

KEKAYI SVM 视 在 产量 模型 的 预测 结果 如 表 5 
所 示 。 可 以 看 出 ， 基 于 本 研究 所 提 数 据 处 理 方 法 建 
立 的 SVM 模型 同样 均 明显 优 于 对 照 方法 。 莽 区 2 和 
芒 区 4 的 MAPE 均 在 10% 以内， 整体 上 比 BPNN 模 
型 精度 略 小 ， 但 效果 提升 不 明显 ， 且 对 芒 区 1、 旋 
区 5 仍 存 在 较 大 的 预测 误差 。 
3.2.8 ”RF 预测 模型 

各 蔗 区 的 REF 视 在 产量 模型 的 预测 结果 如 表 6 
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m5 各 和 蔗 区 SVM 模型 的 视 在 产量 预测 结果 
Table 5 The apparent yield prediction results of the SVM mod- 


els for each planting region 


A7 各 芒 区 LSTM 模型 的 实际 产量 预测 结果 
Table 7 The overall yield prediction results of the LSTM 


models for each planting region 


本 研究 方法 对 照 方法 本 文 方法 TM 

FRU RMSE(rha') MAPE% RMSE/(tha) MAPE/% me RMSE/(tha') MAPE/%  RMSE/(tha') MAPE/% 
REKI 17.94 8.76 33.20 34.57 REKI 19.96 8.78 28.15 22.72 
HEX 2 9.71 10.34 16.88 16.62 K2 8.14 7.50 13.59 15.85 
FRX 3 11.01 14.13 18.71 22.27 BED 5.96 6.23 17.73 27.10 
BEIC 4 AY 6.22 ni 14:14 WEK A 2.60 2.35 9.29 10.68 
RES 11:38 2 16:85 MS EKS 5.22 9.40 1523 17.90 


所 示 。 由 本 研究 所 提 和 气象 因子 分 析 方 法 构建 的 REF 
模型 中 ， 除 了 蕨 区 1 和 芒 区 5 外 ， 其 他 莽 区 均 有 较 
高 精度 ，RMSE 最 低 为 3.5 tha, fiis Jy 7.33 t/ha, 
MAPE 在 3.98%~7.48% Z Ho RF 模型 整体 优 于 
SVM fll BPNN 模型 ， 然 而 对 莽 区 1 和 芒 区 5 还 是 存 
在 较 大 的 预测 误差 ，RMSE 分别 达到 了 31.83 t/ha 和 
11.22 tha。 与 对 照 的 数据 处 理 方法 相 比 ， 本 研究 方 
法 同样 具有 显著 优势 。 
表 6 各 芒 区 RF 模 型 的 视 在 产量 预测 结果 

Table 6 The apparent yield prediction results of the RF models 


for each planting region 


"E 本 文 方法 对 照 方法 
RMSE/(tha') MAPE/%  RMSE/tha') MAPE/% 
HEKI 31.83 13.03 39.62 37.85 
HEK 2 7.33 7.48 11.52 14.77 
FER 3 5.41 6.20 18.02 21.56 
WEE 4 3.50 3.98 9.18 10.61 
EK 5 11.22 19.16 29.64 34.74 


3.2.4 LSTM 预测 模型 

LSTM 模型 的 视 在 产量 预测 结果 如 表 7 所 示 。 
由 本 研究 所 提 和 气象 因子 分 析 方 法 构建 的 LSTM 模型 
在 5 个 蘑 区 均 取 得 较 好 的 结果 ， 各 芒 区 的 MAPE 均 
在 10% 以内， 整体 精度 相 比 于 其 他 3 种 模型 有 较 大 
提高 。 与 对 照 方法 相 比 ， 预 测 精度 也 有 显著 的 提 
高 。 对 照 数据 处 理 方法 所 训练 的 LSTM PRA 
度 相 比 于 其 他 三 种 模型 精度 也 有 明显 提高 。 可 以 看 
出 ， 采 用 LSTM 模型 预测 甘 妨 产量 的 方法 是 最 
优 的 。 
3.2.5 “模型 预测 结果 对 比分 析 

将 基于 同一 种 模型 算法 建立 的 各 芒 区 视 在 产量 


预测 模型 的 测试 集结 果 汇 总 ， 展 示 其 预测 值 与 实际 
值 的 散 点 图 〈 图 3)， 以 评价 各 算法 在 不 同 蔗 区 上 的 
整体 预测 效果 。 

基于 不 同 气象 敏感 因子 提取 方法 的 各 模型 在 所 
有 茧 区 中 的 视 在 产量 预测 结果 如 表 8 所 示 。 可 以 看 
出 ， 经 本 文 方法 构建 LSTM 模 型 ， 其 测试 集 的 整体 
RMSE 和 MAPE 最 低 ， 分 别 为 10.34 t/ha 和 6.85%， 
甘 茂 产量 实际 值 与 预测 值 之 间 的 决定 系数 R 最 高 ， 
达到 了 0.8489， 产 量 趋势 比 其 他 三 个 模型 更 为 拟 
合 。 根 据 表 1 的 各 套 区 甘蔗 产量 统计 数据 可 知 ， 使 
用 LSTM 模 型 预测 甘 其 产量 的 方法 其 误差 在 可 接受 
范围 内 。 使 用 年 均 气 象 因子 构建 的 参照 模型 的 
预测 精度 明显 更 低 。 说 明 本 文 所 提 数 据 处 理 方法 能 
明显 提高 甘蔗 产量 预测 模型 的 精度 。 由 对 比 结果 可 
知 ，LSTM 产量 预测 模型 预测 效果 优 于 BPNN 模 型 、 
SVM 模 型 和 RF 模型 。 


3.3 ZAKAR BER 


为 了 实现 大 区 域 甘蔗 产量 预测 ， 本 研究 使 用 
HP 滤波 ^" 分 离 得 到 各 莽 区 每 年 的 气象 产量 ， 再 将 
5 个 莽 区 的 数据 混合 ， 建 立 通 用 的 气象 产量 预测 模 
型 。 建 模 方 法 主要 采用 了 BPNN、SVM、RF 和 
LSTM， 其 结果 如 表 9 所 示 。 可 以 看 出 ，LSTM 模 型 
在 多 莽 区 中 的 预测 结果 较 差 ， 其 余 三 种 预测 模型 都 
取得 了 良好 的 效果 ，R, 均 在 0.94 以上; BPNN 模型 
的 效果 最 好 ，RMSE 和 MAPE 最低， 分 别 为 0.98 t/ha 
和 9.59%，R, 最 高 ， 达 到 了 0.965. 

本 研究 基于 5 个 蔗 区 数据 建立 的 多 蔗 区 气象 产 
量 预测 模型 ， 采 样 了 混合 数据 的 方法 ， 有 效 地 扩充 
了 数据 集 ， 明 显 地 提升 了 模型 预测 效果 。 考 虑 到 区 
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图 3 基于 同 种 算法 的 各 项 区 预测 模型 的 综合 预测 结果 


Fig. 3 The comprehensive prediction results of all the regional-specific models based on same algorithm 


表 8 不 同 模型 甘蔗 产量 预测 结果 对 比 


Table 8 Yield prediction result comparison between different models 


本 文 方法 对 照 方法 
RMSE/(t-ha`') MAPE/% R? RMSE/(t-ha‘') MAPE/% R? 
BPNN 13.45 11.01 0.7106 22.50 21.15 0.4565 
SVM 12.41 12.03 0.7479 22.02 22.51 0.3425 
RF 15.71 9.97 0.6215 24.45 23.90 0.3937 
LSTM 10.34 6.85 0.8489 11.99 14.63 0.5099 


表 9 不 同 模型 的 气象 产量 预测 结果 对 比 
Table 9 Meteorological yield prediction results comparison 


between different models 


模型 RMSE/(t-ha') ^ MAPE/% g 
SVM 1.29 13.29 0.944 
RF 1.04 9.96 0.957 
BPNN 0.98 9.59 0.965 
LSTM 0.25 39.99 0.770 


域 性 差异 的 影响 ， 通 过 HP 滤波 分 离 出 甘蔗 气象 产 
量 ， 消 除了 由 于 不 同 芒 区 的 生产 条 件 及 社会 经 济 等 
因素 引起 的 差异 ， 由 此 建立 的 通用 模型 更 科学 。 本 
研究 对 气象 数据 的 处 理 也 具有 科学 性 与 独特 性 ， 由 
对 比 结果 可 知 ， 基 于 计算 后 的 气象 数据 与 产量 数据 


建立 的 通用 模型 ， 对 多 区 域 大 范围 甘蔗 产量 的 预测 


根据 敏感 时 段 分 析 法 ， 对 78 个 以 月 为 单位 的 
连续 时 段 气象 均值 数据 与 产量 进行 相关 性 分 析 ， 得 
到 广西 5 个 其 区 的 关键 气象 因子 为 日 照 时 数 、 平 均 
水 气压 、 气 压 、 温 度 、 降 水 量 ; 不 同 气象 因子 的 关 
键 时 段 不 同 ， 同 一 气象 因子 在 不 同时 段 与 产量 的 相 
关 性 甚至 相反 ， 因 此 根据 敏感 时 段 分 析 关 键 气象 因 
子 对 产量 的 影响 具有 现实 意义 。 由 于 不 同 模型 的 原 
理 和 特点 不 同 ， 对 不 同 数据 集 的 表现 不 同 ， 因 此 不 
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同 甘 蔗 产量 模型 的 预测 结果 存在 差异 。 

单 莽 区 预测 模型 结果 表明 ， 基 于 本 人 研究 分 析 所 
得 关键 时 段 敏感 气象 因子 的 BPNN、SVM、RF 以 
及 LSTM 四 种 模型 的 预测 效果 均 明 显 优 于 参考 文献 
[10] 的 对 照 方法 。LSTM 模型 的 整体 RMSE 和 
MAPE 7j Sil) Jj 10.34 t/ha 和 6.85%，R 为 0.8489， 预 
测 效 果 要 明显 优 于 前 人 研究 使 用 较 多 的 其 他 三 种 模 
型 。BPNN、SVM 和 RF 三 种 预测 模型 ， 整 体 精度 
较 高 的 模型 在 部 分 蔗 区 的 预测 精度 可 能 较 低 ， 但 
LSTM 模 型 不 仅 整体 预测 效果 最 好 ， 且 对 各 个 芒 区 
的 MAPE 均 低 于 10%， 因 此 使 用 LSTM 模型 预测 各 
莽 区 的 产量 是 可 行 的 。 

SE AED, Arx fi HI SVM. RF, BPNN 以 
及 LSTM 四 种 模型 预测 混合 样本 的 甘蔗 气象 产量 ， 
实现 多 芒 区 气象 产量 的 预测 。 结 果 表 明 ，BPNN 模 
型 整体 的 RMSE 和 MAPE 分别 为 0.98 t/ha, 9.59%, 
R, 为 0.965， 其 预测 效果 优 于 SVM、RF 以 及 LSTM 
模型 ， 但 除 LSTM 外 其 余 三 种 模型 都 取得 了 良好 的 
效果 。LSTM 不 适用 于 多 莽 区 甘蔗 产量 联合 预测 。 

由 此 可 见 ， 经 过 本 研究 方法 建立 通用 的 多 莽 区 
气象 产量 预测 模型 是 可 行 的 。 对 于 单 莽 区 和 多 芒 区 
的 产量 预测 误差 均 在 可 接受 范围 内 ， 本 研究 预测 方 
法 对 区 域内 甘蔗 产量 预测 具有 一 定 的 参考 意义 。 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
研究 成 果 有 关 的 利益 冲突 。 
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Abstract: 


[Objective] Accurate prediction of changes in sugarcane yield in Guangxi can provide important reference for the formulation of rele- 
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vant policies by the government and provide decision-making basis for farmers to guide sugarcane planting, thereby improving sugar- 
cane yield and quality and promoting the development of the sugarcane industry. This research was conducted to provide scientific da- 
ta support for sugar factories and related management departments, explore the relationship between sugarcane yield and meteorologi- 
cal factors in the main sugarcane producing areas of Guangxi Zhuang Autonomous Region. 

[Methods] The study area included five sugarcane planting regions which laid in five different counties in Guangxi, China. The aver- 
age yields per hectare of each planting regions were provided by Guangxi Sugar Industry Group which controls the sugar refineries of 
each planting region. The daily meteorological data including 14 meteorological factors from 2002 to 2019 were acquired from Na- 
tional Data Center for Meteorological Sciences to analyze their influences placed on sugarcane yield. Since meteorological factors 
could pose different influences on sugarcane growth during different time spans, a new kind of factor which includes meteorological 
factors and time spans was defined, such as the average precipitation in August, the average temperature from February to April, etc. 
And then the inter-correlation of all the meteorological factors of different time spans and their correlations with yields were analyzed 
to screen out the key meteorological factors of sensitive time spans. After that, four algorithms of BP neural network (BPNN), support 
vector machine (SVM), random forest (RF), and long short-term memory (LSTM) were employed to establish sugarcane apparent 
yield prediction models for each planting region. Their corresponding reference models based on the annual meteorological factors 
were also built. Additionally, the meteorological yields of every planting region were extracted by HP filtering, and a general meteoro- 
logical yield prediction model was built based on the data of all the five planting regions by using RF, SVM BPNN, and LSTM, re- 
spectively. 

[Results and Discussions] The correlation analysis showed that different planting regions have different sensitive meteorological fac- 
tors and key time spans. The highly representative meteorological factors mainly included sunshine hours, precipitation, and atmo- 
spheric pressure. According to the results of correlation analysis, in Region 1, the highest negative correlation coefficient with yield 
was observed at the sunshine hours during October and November, while the highest positive correlation coefficient was found at the 
minimum relative humidity in November. In Region 2, the maximum positive correlation coefficient with yield was observed at the av- 
erage vapor pressure during February and March, whereas the maximum negative correlation coefficient was associated with the pre- 
cipitation in August and September. In Region 3, the maximum positive correlation coefficient with yield was found at the 20—20 pre- 
cipitation during August and September, while the maximum negative correlation coefficient was related to sunshine hours in the same 
period. In Region 4, the maximum positive correlation coefficient with yield was observed at the 20—20 precipitation from March to 
December, whereas the maximum negative correlation coefficient was associated with the highest atmospheric pressure from August 
to December. In Region 5, the maximum positive correlation coefficient with yield was found at the average vapor pressure from June 
and to August, whereas the maximum negative correlation coefficient as related to the lowest atmospheric pressure in February and 
March. For each specific planting region, the accuracy of apparent yield prediction model based on sensitive meteorological factors 
during key time spans was obviously better than that based on the annual average meteorological values. The LSTM model performed 
significantly better than the widely used classic BPNN, SVM, and RF models for both kinds of meteorological factors (under sensitive 
time spans or annually). The overall root mean square error (RMSE) and mean absolute percentage error (MAPE) of the LSTM model 
under key time spans were 10.34 t/ha and 6.85%, respectively, with a coefficient of determination R of 0.8489 between the predicted 
values and true values. For the general prediction models of the meteorological yield to multiple the sugarcane planting regions, the 
RF, SVM, and BPNN models achieved good results, and the best prediction performance went to BPNN model, with an RMSE of 
0.98 t/ha, MAPE of 9.59%, and R of 0.965. The RMSE and MAPE of the LSTM model were 0.25 t/ha and 39.99%, respectively, and 
the R? was 0.77. 

[Conclusions] Sensitive meteorological factors under key time spans were found to be more significantly correlated with the yields 
than the annual average meteorological factors. LSTM model shows better performances on apparent yield prediction for specific 
planting region than the classic BPNN, SVM, and RF models, but BPNN model showed better results than other models in predicting 


meteorological yield over multiple sugarcane planting regions. 
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